Apprentissage non supervisé de séries temporelles à l'aide des k-means et d'une nouvelle méthode d'agrégation de séries

نویسندگان

  • Rémi Gaudin
  • Nicolas Nicoloyannis
چکیده

Résumé. L’utilisation d’un algorithme d’apprentissage non supervisé de type k-Means sur un jeu de séries temporelles amène à se poser deux questions : Celle du choix d’une mesure de similarité et celle du choix d’une méthode effectuant l’agrégation de plusieurs séries afin d’en estimer le centre (i.e. calculer les k moyennes). Afin de répondre à la première question, nous présentons dans cet article les principales mesures de similarité existantes puis nous expliquons pourquoi l’une d’entre elles (appelée Dynamic Time Warping) nous parâıt la plus adaptée à l’apprentissage non supervisé. La deuxième question pose alors problème car nous avons besoin d’une méthode d’agrégation respectant les caractéristiques bien particulières du Dynamic Time Warping. Nous pensons que l’association de cette mesure de similarité avec l’agrégation Euclidienne peut générer une perte d’informations importante dans le cadre d’un apprentissage sur la ”forme” des séries. Nous proposons donc une méthode originale d’agrégation de séries temporelles, compatible avec le Dynamic Time Warping, qui améliore ainsi les résultats obtenus à l’aide de l’algorithme des k-Means. Mots-clés : Fouille de données et Apprentissage non supervisé, Séries temporelles, K-Means, Dynamic Time Warping

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Apprentissage de scénarios à partir de séries temporelles multivariées

La construction automatique de scénarios à partir des signaux (séries temporelles) produits par les appareils de surveillance de patients en anesthésie réanimation est le premier pas vers l’élaboration de systèmes de monitoring intelligent. Mais dans ce contexte, les connaissances a priori ne sont pas suffisantes pour orienter efficacement un apprentissage à partir des données complexes que son...

متن کامل

Une approche de classification non supervisée basée sur la détection de singularités et la corrélation de séries temporelles pour la recherche d'états : application à un bioprocédé fed-batch

Résumé. Nous proposons dans cet article une méthode de clustering qui combine l’analyse dynamique et l’analyse statistique pour caractériser des états. Il s’agit d’une méthode de fouille de données qui travaille sur des ensembles de séries temporelles pour détecter des états; ces états représentent les informations les plus significatives du système. L’objectif de cette méthode non supervisée e...

متن کامل

Construction de descripteurs à partir du coclustering pour la classification supervisée de séries temporelles

Résumé. Nous présentons un processus de construction de descripteurs pour la classification supervisée de séries temporelles. Ce processus est libre de tout paramétrage utilisateur et se décompose en trois étapes : (i) à partir des données originales, nous générons de multiples nouvelles représentations simples ; (ii) sur chacune de ces représentations, nous appliquons un algorithme de cocluste...

متن کامل

Modèles de réseaux de neurones pour l'analyse des séries temporelles ou la régression - Estimation, identification, méthode d'élagage SSM

RÉSUMÉ. Ce papier porte sur la modélisation de séries temporelles ou de régression à l’aide de réseaux de neurones. En nous appuyant sur des résultats récents sur l’estimation des moindres carrés pour les séries temporelles non linéaires, nous proposons une méthodologie complète et explicite pour l’estimation des paramètres (processus d’apprentissage) et pour le choix du modèle (sélection d’arc...

متن کامل

Entrepôt de Données dans l’ère Data Science : De la Donnée au Modèle

Résumé. Dans l’ère Data Science, un nombre important de domaines scientifiques souhaitent analyser leurs données. Souvent dans ces domaines, les données des tests sont représentées par des séries chronologiques. Ces dernières sont une classe de données temporelles, comprenant un enregistrement chronologique de valeurs, considérées comme un tout et non comme une liste de données individuelles et...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2005